1
Mendefinisikan Hubungan Melalui Distribusi Bersyarat
MATH003Lesson 10
00:00
Selamat datang di perubahan paradigma dalam statistik. Kita berpindah dari intuisi sederhana tentang "garis tren" ke pendekatan yang ketat Kerangka Distribusi. Di sini, kita mendefinisikan hubungan bukan hanya berdasarkan koefisien korelasi, tetapi sebagai setiap perubahan dalam perilaku probabilitas variabel respons $Y$ saat variabel prediktor $X$ berubah.

Definisi 10.1.1: Ikatan Statistik

Dua variabel $X$ dan $Y$ dianggap terkait jika terdapat setiap perubahan pada distribusi bersyarat $Y$, diberikan $X = x$, seiring berubahnya $x$. Sebaliknya, kondisi "tidak ada hubungan" secara matematis ekuivalen dengan independensi antara $X$ dan $Y$.

Ekuivalensi Logis

Variabel $X$ dan $Y$ tidak saling terkait jika dan hanya jika $f(y|x) = f(y)$ untuk semua nilai $x$. Ini menyiratkan bahwa fungsi frekuensi relatif gabungan dapat difaktorkan menjadi:

$$f(x, y) = f(x)f(y)$$

Oleh karena itu, pengujian hubungan pada dasarnya adalah pengujian terhadap Independensi.

Mekanisme Perubahan

Hubungan diidentifikasi oleh setiap pergeseran pada fungsi kepadatan bersyarat (seperti ditunjukkan pada Gambar 10.1.1). Ini mencakup:

  • Perpindahan Rata-rata: Nilai harapan $E(Y|X)$ berubah (fokus paling umum).
  • Perpindahan Varians: Penyebaran atau ketidakpastian $Y$ bergantung pada $X$ (Heteroskedastisitas).
  • Perubahan Bentuk: Distribusi keseluruhan mengalami transformasi (misalnya, dari simetris menjadi miring).

Menetapkan Kausalitas melalui Desain

Hubungan statistik tidak menunjukkan kausalitas. Untuk menyatakan bahwa $X$ menyebabkan $Y$, kita harus mempertimbangkan variabel pengganggu melalui Desain Percobaan:

  • Perlakuan Kontrol: Memberikan dasar perbandingan.
  • Efek Plasebo: Pengurangan peningkatan yang dirasakan melalui perlakuan tidak aktif.
  • Kegagapan: Menggunakan percobaan buta (penerima tidak mengetahui) dan percobaan ganda-buta (penerima dan peneliti tidak mengetahui) untuk menghilangkan bias.
  • Pemblokiran: Seperti yang terlihat pada Contoh 10.1.7, kita menggunakan variabel pemblokiran ($W$, seperti kesuburan tanah) untuk memastikan hubungan antara jenis gandum ($X$) dan hasil panen ($Y$) tidak dipengaruhi oleh kondisi awal.
🎯 Perkiraan Matematis Inti
Kita memperkirakan ikatan ini menggunakan Likelihood Bersyarat fungsi. Untuk data diskret dengan jumlah $f_{ij}$:
$$L = \prod_{i=1}^a \prod_{j=1}^b (\theta_{j|X=i})^{f_{ij}}$$ Galat Standar: $SE = \sqrt{\frac{\hat{\theta}_{ij}(1 - \hat{\theta}_{ij})}{n}}$